<?php
//爬虫
//获得栏目id
header("Content-type:text/html;charset=gb2312");
$category = $_GET['cid'];

// $ch = curl_init();
// $timeout = 10;
// curl_setopt = ($ch,CURLOPT_URL,$url);
// curl_setopt = ($ch,CURLOPT_RETURNTRANSFER,1);
// curl_setopt = ($ch,CURLOPT_CONNECTTIMEOUT,$timeout);
// $handles = curl_exec($ch);
// curl_close($ch);


if($category){
	$con = mysql_connect('localhost','root','root') or die('请检查数据库连接'.mysql_error());
	mysql_query("SET NAMES gb2312");
	$db = mysql_select_db("get_content",$con);
	if(!$db){
		die("数据库不存在".mysql_error());
	}else {
		//获得提取规则数组
		$sql = "SELECT * FROM `spiders` WHERE `category` = '".$category."'";
		$result = mysql_query($sql);
		$row = mysql_fetch_row($result);
		//var_dump($row);
	}
}else{
	exit("出错了:(");
}

//待获取页面的地址
$list_url = $row[5];
//获取链接列表
$list_content = file_get_contents($list_url);
//获取列表正则规则
$list_match = $row[2];
//获取文章内容正则规则
$content_match = $row[3];
//在链接列表中使用列表正则
preg_match_all($list_match,$list_content,$list_data);
$i = 0;
//获取到一个链接列表
//print_r($list_data[1][1]);

foreach($list_data[1][1] as $detail_url){
	//处理一下，如果已经抓取过了，就跳过去
	$detail_content = file_get_contents("http://auto.sina.com.cn".$detail_url);
	//获取标题
	preg_match('/<h1 id="artibodyTitle".+?>(.+?)<\/h1>/U',$detail_content,$title_data);
	$title = $title_data[1];
	//echo $title."<br />";
	//获取内容，需要根据不同的特点写正则
	//preg_match_all($content_match,$detail_content,$body_data);
	//$body = $body_data[2][0];
	$sql = "INSERT INTO `articles` (`id`,`title`,`click`,`content`,`date`,`category`) VALUES (NULL,'".$title."','','手动内容',now(),'1');";
	$result = mysql_query('$sql');
}

// $detail_content = file_get_contents("http://auto.sina.com.cn".$detail_url);
// echo $detail_content;

//demo
// $testurl = "http://auto.sina.com.cn/news/2012-02-28/0825924559.shtml";
// $content1 = file_get_contents($testurl);
// preg_match_all($content_match,$content1,$list_test);
//print_r($list_test);
// echo $list_test[2][0];

// $a = Array(3,4,5,7);
// foreach($a as $v){
	// $b = $v;
	// echo $b;
// }
// echo "<br /><br /><br /><br />";
// echo $b;

//mysql_free_result('$result');
//mysql_close($db);










?>